智能论文笔记

BAST: Binaural Audio Spectrogram Transformer for Binaural Sound Localization

Sheng Kuang , Kiki van der Heijden , Siamak Mehrkanoon

分类：机器学习

2022-07-08

混响环境中的准确声音定位对于人类听觉感知至关重要。最近，卷积神经网络（CNN）已被用于对双耳人类听觉途径进行建模。但是，CNN显示出捕获全球声学特征的障碍。为了解决这个问题，我们提出了一种新型的端到端双耳音频谱图变压器（BAST）模型，以预测态和混响环境中的声音方位角。探索了两种模式的实现模式，即分别与共享和非共享参数的BAST模型相对应的BAST-SP和BAST-NSP。我们使用减法的模型和杂种损耗的模型在所有方位角都达到了1.29度的角度距离，均值为1E-3的均方根误差为1E-3，显着超过了基于CNN的模型。对BAST在左右半菲尔德和回荡环境中的表现的探索性分析显示了其泛化能力以及双耳变压器在声音定位中的可行性。此外，提供了注意图的分析，以提供有关自然混响环境中本地化过程的解释的更多见解。

translated by 谷歌翻译

Deep coastal sea elements forecasting using U-Net based models

Jesús García Fernández , Ismail Alaoui Abdellaoui , Siamak Mehrkanoon

分类：机器学习 | 计算机视觉

2020-11-06

能量供应和需求受到气象条件的影响。随着对可再生能源的需求增加，精确天气预报的相关性增加。能源提供者和决策者要求天气信息进行明智的选择，并根据业务目标建立最佳计划。由于最近应用于卫星图像的深度学习技术，使用遥感数据的天气预报也是主要进步的主题。本文通过基于U-Net的架构调查了荷兰沿海海洋元素的多个步骤框架预测。来自哥白尼观察计划的每小时数据在2年内跨过跨越2年的时间，用于培训模型并进行预测，包括季节性预测。我们提出了U-Net架构的变化，并使用剩余连接，并行卷积和不对称卷积进一步扩展了这一新颖模型，以便引入三种额外的架构。特别是，我们表明，配备有平行和不对称卷积的架构以及跳过连接优于其他三个讨论的模型。

translated by 谷歌翻译

DOC-NAD: A Hybrid Deep One-class Classifier for Network Anomaly Detection

Mohanad Sarhan , Gayan Kulatilleke , Wai Weng Lo , Siamak Layeghy , Marius Portmann

分类：机器学习

2022-12-15

Machine Learning (ML) approaches have been used to enhance the detection capabilities of Network Intrusion Detection Systems (NIDSs). Recent work has achieved near-perfect performance by following binary- and multi-class network anomaly detection tasks. Such systems depend on the availability of both (benign and malicious) network data classes during the training phase. However, attack data samples are often challenging to collect in most organisations due to security controls preventing the penetration of known malicious traffic to their networks. Therefore, this paper proposes a Deep One-Class (DOC) classifier for network intrusion detection by only training on benign network data samples. The novel one-class classification architecture consists of a histogram-based deep feed-forward classifier to extract useful network data features and use efficient outlier detection. The DOC classifier has been extensively evaluated using two benchmark NIDS datasets. The results demonstrate its superiority over current state-of-the-art one-class classifiers in terms of detection and false positive rates.

translated by 谷歌翻译

Stacking Ensemble Learning in Deep Domain Adaptation for Ophthalmic Image Classification

Yeganeh Madadi , Vahid Seydi , Jian Sun , Edward Chaum , Siamak Yousefi

分类：计算机视觉 | 人工智能 | 机器学习

2022-09-27

鉴于大量具有相似属性但域不同的标记数据的可用性，域的适应性是一种有吸引力的方法。在图像分类任务中，获得足够的标签数据具有挑战性。我们提出了一种名为Selda的新方法，用于通过扩展三种域适应方法来堆叠合奏学习，以有效解决现实世界中的问题。主要假设是，当将基本域适应模型组合起来时，我们可以通过利用每个基本模型的能力来获得更准确，更健壮的模型。我们扩展最大平均差异（MMD），低级别编码和相关比对（珊瑚），以计算三个基本模型中的适应损失。同样，我们利用一个两双连接的层网络作为元模型来堆叠这三个表现良好的域适应模型的输出预测，以获得眼科图像分类任务的高精度。使用与年龄相关的眼病研究（AREDS）基准眼科数据集的实验结果证明了该模型的有效性。

translated by 谷歌翻译

Reducing Retraining by Recycling Parameter-Efficient Prompts

Brian Lester , Joshua Yurtsever , Siamak Shakeri , Noah Constant

分类：自然语言处理

2022-08-10

参数效率的方法能够使用单个冷冻的预训练的大语言模型（LLM）来通过学习特定于任务的软提示来执行许多任务，从而在串联到输入文本时调节模型行为。但是，这些学习的提示与给定的冷冻模型紧密耦合 - 如果模型已更新，则需要获得相应的新提示。在这项工作中，我们提出并调查了几种“提示回收”的方法，其中将在源模型上进行了及时培训以与新目标模型一起使用。我们的方法不依赖于目标模型的有监督的提示，特定于任务的数据或培训更新，这与从头开始的目标模型重新调整提示一样昂贵。我们表明，模型之间的回收是可能的（我们的最佳设置能够成功回收$ 88.9 \％的提示，从而产生一个提示，即表现出色的基线），但是剩下的大量性能净空，需要改进的回收技术。

translated by 谷歌翻译

XG-BoT: An Explainable Deep Graph Neural Network for Botnet Detection and Forensics

Wai Weng Lo , Siamak Layeghy , Mohanad Sarhan , Marius Portmann

分类：机器学习

2022-07-19

在本文中，我们提出了XG-Bot，这是一种可解释的深层图神经网络模型，用于僵尸网络淋巴结检测。所提出的模型主要由僵尸网络检测器和自动取证的解释器组成。XG机器人检测器可以有效检测大型网络下的恶意僵尸网络节点。具体而言，它利用与图同构网络的分组可逆残差连接从僵尸网络通信图中学习表达性节点表示。XG机器人中的解释器可以通过突出可疑网络流和相关的僵尸网络节点来执行自动网络取证。我们评估了现实世界中的大规模僵尸网络网络图。总体而言，就评估指标而言，XG机器人能够超越最先进的方法。此外，我们表明XG机器人解释器可以基于自动网络取证的Gnnexplainer生成有用的解释。

translated by 谷歌翻译

Anomal-E: A Self-Supervised Network Intrusion Detection System based on Graph Neural Networks

Evan Caville , Wai Weng Lo , Siamak Layeghy , Marius Portmann

分类：机器学习 | 人工智能

2022-07-14

本文研究了图形神经网络（GNNS）应用程序，以进行自我监督的网络入侵和异常检测。 GNN是一种基于图的数据的深度学习方法，它将图形结构纳入学习以概括图表和输出嵌入。由于网络流量自然基于图，因此GNN非常适合分析和学习网络行为。基于GNN的网络入侵检测系统（NIDSS）的最新实现很大程度上依赖于标记的网络流量，这不仅可以限制输入流量的数量和结构，还可以限制NIDSS的潜力来适应看不见的攻击。为了克服这些限制，我们提出了异常-E，这是GNN的入侵和异常检测方法，该方法在自我监督过程中利用边缘特征和图形拓扑结构。据我们所知，这种方法是第一种成功且实用的方法来进行网络入侵检测，该方法利用网络流动在自我监督，边缘利用GNN中。两个现代基准NIDS数据集的实验结果不仅清楚地显示了使用Anomal-E嵌入而不是原始功能的改进，而且还显示了对野生网络流量检测的潜在异常-E具有的潜在异常功能。

translated by 谷歌翻译

Utility Theory for Sequential Decision Making

Mehran Shakerinava , Siamak Ravanbakhsh

分类：人工智能 | 机器学习

2022-06-27

von Neumann-Morgenstern（VNM）实用程序定理表明，在某些合理性的公理下，决策将减少以最大程度地提高某些效用函数的期望。我们将这些公理扩展到日益结构化的顺序决策设置，并确定相应的实用程序函数的结构。特别是，我们表明，无内存的偏好会导致以每次过渡奖励和未来回报的乘法因素的形式产生实用性。该结果激发了马尔可夫决策过程（MDP）的概括，并在代理的申报表上使用此结构，我们称之为Affine-Reward-Reward MDP。需要对偏好的更强限制来恢复MDP中常用的标量奖励总和。尚未更强的约束简化了目标寻求代理的效用功能，以我们调用潜在功能的状态的某些函数的差异形式。我们的必要条件揭示了奖励假设，即通过在VNM理性公理中添加公理，并激发了涉及顺序决策的AI研究的新方向，从而使理性代理在增强学习中的设计构成了奖励假设。

translated by 谷歌翻译

Context matters for fairness -- a case study on the effect of spatial distribution shifts

Siamak Ghodsi , Harith Alani , Eirini Ntoutsi

分类：机器学习 | 人工智能

2022-06-23

随着基于数据驱动的基于AI的决策技术在我们日常的社交生活中的越来越多，这些系统的公平性正成为一种关键现象。但是，利用此类系统的一个重要且通常充满挑战的方面是区分其应用程序范围的有效性，尤其是在分配变化下，即当模型被部署在与培训集不同的数据上时。在本文中，我们介绍了一项关于新发布的美国人口普查数据集的案例研究，该数据集是对流行成人数据集的重建，以说明上下文对公平性的重要性，并表明空间分布转移如何影响预测性和公平性相关的性能一个模型。公平感知的学习模型的问题仍然存在着上下文特定的公平干预措施在各州和不同人口群体之间的影响。我们的研究表明，在将模型部署到另一个环境之前，必须进行分配变化的鲁棒性。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译